文本驱动 - 智狐AI导航

StyleShot

StyleShot 是一个开源的AI图像风格迁移模型，能够实现文本和图像驱动的风格迁移。它利用风格感知编码器和内容融合编码器，捕捉和再现风格细节，生成高质量的风格化图像。主要应用场景包括艺术创作、社交媒体、游戏开发和电影视频制作。

AI项目与工具 2025年06月12日 13 点赞 0 评论 696 浏览

PoseTalk

PoseTalk 是一款基于文本和音频驱动的开源工具，专注于生成自然且逼真的头部动画视频。它通过 Pose Latent Diffusion (PLD) 模型和级联网络实现唇部同步与运动细化，广泛应用于虚拟助手、在线教育和娱乐等领域，提供多样化的动画生成能力和高度精准的唇形同步效果。

AI项目与工具 2025年06月12日 53 点赞 0 评论 723 浏览

MotionCLR

MotionCLR是一款利用自注意力和交叉注意力机制的人体动作生成与编辑工具。它能够根据文本提示生成动作，并支持多种编辑操作，如动作强调、减弱、替换、擦除及风格迁移。MotionCLR在动作生成的精度、多样性及编辑灵活性上表现出色，广泛应用于游戏开发、动画制作、虚拟现实等领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 761 浏览

SeedEdit

SeedEdit是一款基于自然语言指令的通用图像编辑工具，能够实现修图、换装、风格转换等多种编辑功能。它在图像重建与生成之间找到最佳平衡，支持零样本学习和多轮编辑操作，确保高质量输出。SeedEdit适用于社交媒体、广告、电商、艺术创作等多个领域，提供从简单调整到复杂创意的全面解决方案。

AI项目与工具 2025年06月12日 27 点赞 0 评论 520 浏览

MultiFoley

MultiFoley是一款基于多模态控制的音效生成系统，能够根据文本、音频或视频输入生成与视频同步的高质量Foley声音效果。它支持文本驱动和音频驱动的音效生成，同时具备音频扩展和质量控制功能，广泛应用于电影、游戏、动画及虚拟现实等领域，为用户提供灵活且高效的声音设计解决方案。

AI项目与工具 2025年06月12日 78 点赞 0 评论 841 浏览

MotionFix

MotionFix是一个开源的3D人体动作编辑工具，采用自然语言描述与条件扩散模型TMED相结合的方式，支持通过文本指令精准编辑3D人体动作。其主要功能包括文本驱动的动作编辑、半自动数据集构建、多模态输入处理及基于检索的评估指标。MotionFix适用于动画制作、游戏开发、虚拟现实等多个领域，为动作编辑提供了灵活性与精确性。

AI项目与工具 2025年06月12日 13 点赞 0 评论 828 浏览

ConsisID

ConsisID是一款由北京大学和鹏城实验室开发的文本到视频生成工具，其核心技术在于通过频率分解保持视频中人物身份的一致性。该模型具备高质量视频生成能力、无需微调的特点以及强大的可编辑性，同时拥有优秀的泛化性能。其主要功能包括身份保持、高质量视频生成、文本驱动编辑以及跨领域人物处理，广泛应用于个性化娱乐、虚拟主播、影视制作、游戏开发及教育模拟等领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 720 浏览

ClotheDreamer

ClotheDreamer是一项基于文本描述生成高保真3D服装的技术，采用Disentangled Clothe Gaussian Splatting (DCGS) 和双向Score Distillation Sampling (SDS) 等先进技术，支持自定义模板输入和多体型适配，适用于虚拟试穿、游戏开发、电影制作及虚拟现实等场景。

AI项目与工具 2025年06月12日 15 点赞 0 评论 796 浏览

DiffSensei是一款由北京大学、上海AI实验室及南洋理工大学联合开发的漫画生成框架，它结合了基于扩散的图像生成技术和多模态大型语言模型（MLLM）。该工具能够根据用户提供的文本提示和角色图像，生成具有高精度和视觉吸引力的黑白漫画面板，支持多角色场景下的互动与布局调整。其核心技术包括掩码交叉注意力机制、对话布局编码以及MLLM作为特征适配器等，广泛应用于漫画创作、个性化内容生成、教育和培训等领

AI项目与工具 2025年06月12日 47 点赞 0 评论 684 浏览

NeuralSVG

NeuralSVG是一种基于文本驱动的矢量图形生成工具，利用多层感知器网络将文本提示转化为结构清晰、可编辑的矢量图形。它支持动态调整图形属性，具备隐式神经表示和分数蒸馏采样优化技术，确保图形语义明确、层次分明，适用于艺术创作、设计及学术研究等领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 562 浏览

文本驱动

首页

文本驱动

列表

默认

浏览次数

发布日期